模式识别与人工智能
2025年4月4日 星期五   首 页     期刊简介     编委会     投稿指南     伦理声明     联系我们                                                                English
模式识别与人工智能  2015, Vol. 28 Issue (8): 686-693    DOI: 10.16451/j.cnki.issn1003-6059.201508003
论文与报告 最新目录| 下期目录| 过刊浏览| 高级检索 |
面向类不平衡的逻辑回归方法*
郭华平1,董亚东2,邬长安1,范明2
1.信阳师范学院 计算机与信息技术学院 信阳 414000
2.郑州大学 信息工程学院 郑州 450052
Logistic Regression Method for Class Imbalance Problem
GUO Hua-Ping1, DONG Ya-Dong2, WU Chang-An1, FAN Ming2
1.College of Computer and Information Technology, Xinyang Normal University, Xinyang 414000
2.School of Infomation Engineering, Zhengzhou University, Zhengzhou 450052

全文: PDF (397 KB)   HTML (1 KB) 
输出: BibTeX | EndNote (RIS)      
摘要 作为机器学习和模式识别中最重要的分类模型之一,逻辑回归(LR)具有较好的可解释性、泛化性.文中将该模型应用到类不平衡问题中,提出面向类不平衡的逻辑回归方法(LRCI)以处理数据不平衡问题.为了充分考虑数据不平衡性,分别构造基于g-mean的目标函数(GBM)和基于f-measure的目标函数(FBM),监督LRCI学习模型参数,进而有效保证学习到的模型同时具有高准确率和召回率.UCI数据集上的实验表明,LRCI在保持LR高准确率的前提下,有效提高它的召回率、g-mean和f-measure.与其他类不平衡分类模型相比,LRCI表现出较明显优势.
服务
把本文推荐给朋友
加入我的书架
加入引用管理器
E-mail Alert
RSS
作者相关文章
Abstract:As one of the most important classification models in pattern recognition and machine learning, logistic regression(LR) is an interpretable model and has good generalization ability. In this paper, LR model is applied to class imbalance problem, and a method, named LR for class imbalance (LRCI), is proposed to tackle data imbalance problem. To take a full consideration of data imbalance, two objective functions g-mean based metric (FBM) and f-measure based metric(GBM) are constructed respectively to supervise LRCI learning model parameters. And then, the model is effectively quaranteed high accuracy and recall rate. The experimental results on UCI datasets show that LRCI significantly boosts the performance on recall, g-mean and f-measure in the premise of high accuracy of LRCI. Besides, LRCI presents significant advantage comparing to other state-of-the-art class imbalance learning model.
收稿日期: 2014-10-08     
ZTFLH: TP 181  
基金资助:国家自然科学基金项目(No.61402393)、河南省教育厅科学技术研究项目(No.14A520016,14B520045,12A520035)资助
作者简介: 郭华平(通讯作者),男,1982年生,博士研究生,讲师,主要研究方向为机器学习、数据挖掘.E-mail:hpguo.gm@gmail.com.董亚东,男,1989年生,硕士研究生,主要研究方向为数据挖掘.邬长安,男,1959年生,硕士,教授,主要研究方向为模式识别.范明,男,1948年生,教授,博士生导师,主要研究方向为机器学习、数据挖掘、数据库.
引用本文:   
郭华平,董亚东,邬长安,范明. 面向类不平衡的逻辑回归方法*[J]. 模式识别与人工智能, 2015, 28(8): 686-693. GUO Hua-Ping, DONG Ya-Dong, WU Chang-An, FAN Ming. Logistic Regression Method for Class Imbalance Problem. , 2015, 28(8): 686-693.
链接本文:  
http://manu46.magtech.com.cn/Jweb_prai/CN/10.16451/j.cnki.issn1003-6059.201508003      或     http://manu46.magtech.com.cn/Jweb_prai/CN/Y2015/V28/I8/686
版权所有 © 《模式识别与人工智能》编辑部
地址:安微省合肥市蜀山湖路350号 电话:0551-65591176 传真:0551-65591176 Email:bjb@iim.ac.cn
本系统由北京玛格泰克科技发展有限公司设计开发 技术支持:support@magtech.com.cn